Analisi bibliometrica - I docenti del DMIF
Introduzione
Che cosa è la bibliometria?
La bibliometria è una disciplina che utilizza analisi quantitative e statistiche per analizzare le pubblicazioni scientifiche e le loro relazioni.
Il progetto si focalizza sull’analisi della produzione scientifica dei docenti del dipartimento DMIF dell’Università degli Studi di Udine, per cercare di dare una stima di:
come collaborano gli autori
quali sono i settori di maggiore interesse
gli autori più prolifici.
Per supporto all’analisi è stata utilizzata una libreria, Bibliometrix (Aria and Cuccurullo 2017), sviluppata da due docenti dell’Università di Napoli.
Fonte dei dati
I dati analizzati in questo progetto sono stati scaricati (ultimo download: 15/07/2024) da Scopus, uno dei principali dabatase bibliografici. E’ stata selezionata la sotto area “computer science” e successivamente sono stati selezionati 31 autori del DMIF, tra docenti e dottorandi.
Ogni articolo del dataframe contiene svariati attributi tra cui: la lista di autori, il titolo del documento, la sorgente di pubblicazione, il tipo di documento, le parole chiavi degli autori, le references, il numero di citazioni e l’anno di pubblicazione.
Analisi bibliometrica
Analisi descrittiva del dataframe
La tabella delle informazioni principali descrive le dimensioni della raccolta in termini di numero di documenti, numero di autori, numero di fonti, numero di parole chiave, durata e numero medio di citazioni.
“docs per autori” è calcolato come rapporto tra il numero totale di autori e il numero totale di articoli.
“co-autori per articolo” è calcolato come numero medio di co-autori per articolo.
MAIN INFORMATION ABOUT DATA
Timespan 1987 : 2024
Sources (Journals, Books, etc) 394
Documents 1279
Annual Growth Rate % 10.17
Document Average Age 10.7
Average citations per doc 13.94
Average citations per year per doc 1.25
References 29749
DOCUMENT CONTENTS
Keywords Plus (ID) 6360
Author's Keywords (DE) 2017
AUTHORS
Authors 1027
Author Appearances 4349
Authors of single-authored docs 17
AUTHORS COLLABORATION
Single-authored docs 77
Documents per Author 1.25
Co-Authors per Doc 3.4
International co-authorships % 32.53
Annual Scientific Production
Year Articles
1987 1
1988 1
1989 1
1990 1
1991 3
1993 4
1994 5
1995 12
1996 7
1997 10
1998 11
1999 9
2000 15
2001 17
2002 25
2003 23
2004 44
2005 29
2006 35
2007 49
2008 54
2009 60
2010 46
2011 44
2012 40
2013 32
2014 50
2015 58
2016 55
2017 60
2018 85
2019 59
2020 73
2021 62
2022 76
2023 87
2024 36
Annual Percentage Growth Rate 10.17
Most Productive Authors
Authors Articles Authors Articles Fractionalized
1 MONTANARI A 200 CHITTARO L 78.6
2 CHITTARO L 164 MONTANARI A 58.6
3 MIZZARO S 131 MIZZARO S 41.1
4 DOVIER A 119 POLICRITI A 40.3
5 POLICRITI A 111 DOVIER A 40.0
6 MICULAN M 84 MICULAN M 37.9
7 PIAZZA C 84 PIAZZA C 27.4
8 FORESTI GL 59 LANCIA G 26.1
9 PICIARELLI C 59 FRANCESCHET M 22.3
10 FONTANA F 57 BRAJNIK G 21.2
Top manuscripts per citations
Paper DOI TC TCperYear NTC
1 CORNIA M, 2018, IEEE TRANS IMAGE PROCESS 10.1109/TIP.2018.2851672 410 58.57 26.48
2 BUTTUSSI F, 2018, IEEE TRANS VISUAL COMPUT GRAPHICS 10.1109/TVCG.2017.2653117 309 44.14 19.96
3 CHITTARO L, 2007, COMPUT EDUC 10.1016/j.compedu.2005.06.002 297 16.50 12.03
4 CHITTARO L, 2015, IEEE TRANS VISUAL COMPUT GRAPHICS 10.1109/TVCG.2015.2391853 265 26.50 15.88
5 NADALIN F, 2012, BMC BIOINFORM 10.1186/1471-2105-13-S14-S8 250 19.23 13.66
6 CHITTARO L, 2006, COMPUTER 10.1109/MC.2006.109 250 13.16 7.68
7 PICIARELLI C, 2006, PATTERN RECOGN LETT 10.1016/j.patrec.2006.02.004 222 11.68 6.82
8 JENSEN CS, 1998, LECT NOTES COMPUT SCI 10.1007/bfb0053710 220 8.15 4.51
9 FRANCESCHET M, 2010, J INF 10.1016/j.joi.2010.06.003 185 12.33 6.44
10 FRANCESCHET M, 2010, SCIENTOMETRICS 10.1007/s11192-009-0021-2 177 11.80 6.16
Corresponding Author's Countries
Country Articles Freq SCP MCP MCP_Ratio
1 ITALY 652 0.88227 518 134 0.206
2 SWITZERLAND 12 0.01624 0 12 1.000
3 UNITED KINGDOM 11 0.01488 0 11 1.000
4 USA 9 0.01218 0 9 1.000
5 SPAIN 8 0.01083 0 8 1.000
6 DENMARK 7 0.00947 0 7 1.000
7 FRANCE 6 0.00812 0 6 1.000
8 MEXICO 5 0.00677 0 5 1.000
9 NETHERLANDS 5 0.00677 0 5 1.000
10 FINLAND 3 0.00406 0 3 1.000
SCP: Single Country Publications
MCP: Multiple Country Publications
Total Citations per Country
Country Total Citations Average Article Citations
1 ITALY 11155 17.11
2 DENMARK 227 32.43
3 USA 209 23.22
4 UNITED KINGDOM 200 18.18
5 SPAIN 123 15.38
6 FRANCE 94 15.67
7 MEXICO 81 16.20
8 NETHERLANDS 69 13.80
9 CYPRUS 65 32.50
10 SOUTH AFRICA 65 65.00
Most Relevant Sources
Sources
1 LECTURE NOTES IN COMPUTER SCIENCE (INCLUDING SUBSERIES LECTURE NOTES IN ARTIFICIAL INTELLIGENCE AND LECTURE NOTES IN BIOINFORMATICS)
2 CEUR WORKSHOP PROCEEDINGS
3 THEORETICAL COMPUTER SCIENCE
4 LEIBNIZ INTERNATIONAL PROCEEDINGS IN INFORMATICS LIPICS
5 ACM INTERNATIONAL CONFERENCE PROCEEDING SERIES
6 ELECTRONIC PROCEEDINGS IN THEORETICAL COMPUTER SCIENCE EPTCS
7 ELECTRONIC NOTES IN THEORETICAL COMPUTER SCIENCE
8 EURO ADVANCED TUTORIALS ON OPERATIONAL RESEARCH
9 INFORMATION AND COMPUTATION
10 INTERNATIONAL JOURNAL OF HUMAN COMPUTER STUDIES
Articles
1 249
2 118
3 33
4 29
5 26
6 25
7 24
8 16
9 15
10 15
Most Relevant Keywords
Author Keywords (DE) Articles Keywords-Plus (ID) Articles
1 EVALUATION 31 COMPUTER CIRCUITS 125
2 MODEL CHECKING 26 SEMANTICS 103
3 VIRTUAL REALITY 25 TEMPORAL LOGIC 100
4 MOBILE DEVICES 24 LOGIC PROGRAMMING 97
5 INTERVAL TEMPORAL LOGIC 22 ARTIFICIAL INTELLIGENCE 92
6 DEEP LEARNING 21 INFORMATION RETRIEVAL 72
7 CROWDSOURCING 19 AUTOMATA THEORY 68
8 COMPLEXITY 18 INTERVAL TEMPORAL LOGIC 68
9 MACHINE LEARNING 16 ALGORITHMS 64
10 BISIMULATION 15 COMPUTABILITY AND DECIDABILITY 61
Autore più produttivo: Prof. Montanari con 200 articoli.
Paese più produttivo: Italia.
Anno più produttivo: 2023 con 87 pubblicazioni.
Anno con media citazioni in articoli più alta: 2018.
Anno con più citazioni: 1987.
Documenti per tipo
DT n
1 CONFERENCE PAPER 713
2 ARTICLE 462
3 BOOK CHAPTER 42
4 EDITORIAL 40
5 REVIEW 16
6 ERRATUM 2
7 BOOK 1
8 DATA PAPER 1
9 NOTE 1
10 SHORT SURVEY 1
Tipo di pubblicazione più presente: conference paper, seguito da articoli e capitoli di libro.
Analisi dei riferimenti citati
E’ possibile analizzare la frequenza dei riferimenti/primi autori più citati nel dataset in analisi.
Papers citati più frequentemente:
[,1]
MOSZKOWSKI B., REASONING ABOUT DIGITAL CIRCUITS, (1983) 36
ALLEN J.F., MAINTAINING KNOWLEDGE ABOUT TEMPORAL INTERVALS, COMMUNICATIONS OF THE ACM, 26, 11, PP. 832-843, (1983) 32
BRESOLIN D., GORANKO V., MONTANARI A., SCIAVICCO G., PROPOSITIONAL INTERVAL NEIGHBORHOOD LOGICS: EXPRESSIVENESS, DECIDABILITY, AND UNDECIDABLE EXTENSIONS, ANNALS OF PURE AND APPLIED LOGIC, 161, 3, PP. 289-304, (2009) 25
VENEMA Y., A MODAL LOGIC FOR CHOPPING INTERVALS, JOURNAL OF LOGIC AND COMPUTATION, 1, 4, PP. 453-476, (1991) 25
HALPERN J., SHOHAM Y., A PROPOSITIONAL MODAL LOGIC OF TIME INTERVALS, JOURNAL OF THE ACM, 38, 4, PP. 935-962, (1991) 23
VENEMA Y., EXPRESSIVENESS AND COMPLETENESS OF AN INTERVAL TENSE LOGIC, NOTRE DAME JOURNAL OF FORMAL LOGIC, 31, 4, PP. 529-547, (1990) 23
HALPERN J.Y., SHOHAM Y., A PROPOSITIONAL MODAL LOGIC OF TIME INTERVALS, JOURNAL OF THE ACM, 38, 4, PP. 935-962, (1991) 21
HILLSTON J., A COMPOSITIONAL APPROACH TO PERFORMANCE MODELLING, (1996) 19
ALLEN J.F., MAINTAINING KNOWLEDGE ABOUT TEMPORAL INTERVALS, COMMUN. ACM, 26, 11, PP. 832-843, (1983) 17
BRESOLIN D., MONTANARI A., SCIAVICCO G., AN OPTIMAL DECISION PROCEDURE FOR RIGHT PROPOSITIONAL NEIGHBORHOOD LOGIC, JOURNAL OF AUTOMATED REASONING, 38, 1-3, PP. 173-199, (2007) 16
Si noti che 2 articoli del Professor Montanari sono tra i più citati.
Primi autori citati più frequentemente:
[,1]
MONTANARI A 1120
ET AL 1063
SCIAVICCO G 449
DOVIER A 409
MIZZARO S 407
POLICRITI A 381
SALA P 380
CHITTARO L 365
PONTELLI E 348
BRESOLIN D 345
GORANKO V 292
MICULAN M 285
PIAZZA C 271
PERON A 242
FORMISANO A 199
E’ possibile notare che gli autori più frequentemente citati sono i Professori Montanari, Dovier, Mizzaro e Policriti.
H-index degli autori
L’h-index è una metrica a livello di autore che cerca di misurare sia la produttività che l’impatto citazionale delle pubblicazioni.
L’indice si basa sull’insieme degli articoli più citati dello scienziato e sul numero di citazioni ricevute in altre pubblicazioni. L’indice è strutturato per quantificare mediante un singolo indice numerico non solo la produzione, ma anche l’influenza di uno scienziato, distinguendolo da chi ha pubblicato molti articoli ma di scarso interesse.
Quindi, uno scienziato ha un indice n se almeno n lavori tra quelli che ha pubblicato sono stati citati almeno n volte ciascuno.
L’i10-index consiste nel numero di pubblicazioni di uno stesso autore con almeno 10 citazioni.
H-index dei primi 10 autori più produttivi (in questa raccolta):
Element h_index i10_index TC NP PY_start
1 CHITTARO L 39 93 4886 164 1991
2 MONTANARI A 23 63 2144 200 1993
3 MIZZARO S 20 40 1453 131 1997
4 POLICRITI A 19 43 1608 111 1990
5 DOVIER A 18 38 1212 119 1998
6 PICIARELLI C 17 25 961 59 2005
7 MICULAN M 16 26 709 84 1994
8 PIAZZA C 16 23 894 84 2000
9 FORESTI GL 15 23 874 59 2005
10 FONTANA F 9 8 262 57 2010
Gli autori con l’H-index più alto sono i Prof. Chittaro (39), Prof. Montanari (23) e Prof. Mizzaro (20).
Matrici di rete bibliografica
Gli attributi dei paper sono collegati tra loro attraverso il paper stesso: autore/i alla rivista, parole chiave alla data di pubblicazione, ecc. Alcune delle analisi descrittive viste in precedenza si possono visualizzare attraverso reti bipartite.
Reti bipartite
Queste connessioni di diversi attributi generano reti bipartite che possono essere rappresentate come matrici rettangolari (Papers x Attributi).
Rete Paper x Fonte di pubblicazione:
L’oggetto è una matrice binaria rettangolare che rappresenta una rete bipartita in cui le righe e le colonne sono, in questo caso, rispettivamente papers e fonti.
L’elemento generico \(bip_{ij}\) è 1 se il paper \(i\) è stato pubblicato nella fonte \(j\), 0 altrimenti.
La somma della colonna \(j\)-esima \(bip_j\) rappresenta il numero di papers pubblicati nella fonte \(j\).
Fonti di pubblicazione più rilevanti:
LECTURE NOTES IN COMPUTER SCIENCE (INCLUDING SUBSERIES LECTURE NOTES IN ARTIFICIAL INTELLIGENCE AND LECTURE NOTES IN BIOINFORMATICS)
249
CEUR WORKSHOP PROCEEDINGS
118
THEORETICAL COMPUTER SCIENCE
33
LEIBNIZ INTERNATIONAL PROCEEDINGS IN INFORMATICS, LIPICS
29
ACM INTERNATIONAL CONFERENCE PROCEEDING SERIES
26
Rete degli autori: Paper x Autore, conta quanti articoli fatti da autori.
MONTANARI A CHITTARO L MIZZARO S DOVIER A POLICRITI A
200 164 131 119 111
Accoppiamento bibliografico - autori
Le pubblicazioni scientifiche contengono riferimenti ad altri lavori scientifici. Questo genera un’altra rete, quella delle reti di accoppiamento o co-citazioni.
Due autori sono accoppiati bibliograficamente se almeno una fonte citata compare nelle loro pubblicazioni.
Rete di accoppiamento: \[B = A\cdot A^T\] dove A è una rete bipartita (Papers x Citazioni). Due autori sono collegati da un arco nella rete se citano insieme uno o più documenti.
L’elemento \(b_{i,j}\) indica quanti accoppiamenti bibliografici esistono tra \(i\) e \(j\). La forza dell’accoppiamento di due autori, \(i\) e \(j\), è definita dal numero di riferimenti che gli autori hanno in comune.
L’accoppiamento bibliografico tra autori è una misura di quanto due autori condividono riferimenti comuni nelle loro pubblicazioni. In altre parole, quanti autori citano gli stessi lavori nelle loro ricerche.
(Per comodità nella computazione e visualizzazione, vengono utilizzati soltanto i 40 nodi con il grado più alto).
Analisi della rete
I nodi più centrale della rete risultano essere il Professor Chittaro ed il Professor Montanari. Il primo ha i valori più alti nella centralità di betweenness e pagerank, mentre il secondo nella centralità di grado, di autovettore e closeness. 1.
# A tibble: 40 × 5
name degree closeness betweenness eigen
<chr> <dbl> <dbl> <dbl> <dbl>
1 MONTANARI A 43.1 0.000605 0.108 1
2 SALA P 19.4 0.000493 0.000242 0.713
3 SCIAVICCO G 17.0 0.000569 0.00808 0.554
4 PERON A 16.1 0.000501 0.000389 0.621
5 DOVIER A 13.6 0.000607 0.0852 0.00871
6 BOZZELLI L 13.6 0.000498 0.000237 0.541
7 MIZZARO S 13.4 0.000598 0.108 0.00252
8 MOLINARI A 12.3 0.000500 0.000229 0.490
9 PIAZZA C 11.6 0.000565 0.0577 0.0176
10 ROITERO K 10.4 0.000565 0.0329 0.00252
# ℹ 30 more rows
vertex cluster degree_centrality btw_centrality clos_centrality eigen_centrality pagerank_centrality
1 montanari a 1 0.82051282 50.666236 0.02173913 1.00000000 0.044729316
2 chittaro l 1 0.74358974 102.696307 0.02040816 0.86744491 0.045364768
4 dovier a 1 0.74358974 43.715810 0.02040816 0.92614594 0.040594149
5 policriti a 1 0.66666667 22.329556 0.01886792 0.87974408 0.036461371
6 miculan m 1 0.46153846 11.252372 0.01639344 0.59638520 0.026895646
7 piazza c 1 0.66666667 16.312693 0.01923077 0.90679169 0.036044751
8 foresti gl 1 0.30769231 11.576923 0.01515152 0.33841027 0.020934465
9 piciarelli c 1 0.23076923 1.305995 0.01449275 0.27945626 0.015457702
10 fontana f 1 0.05128205 0.000000 0.01204819 0.06086337 0.006562515
11 formisano a 1 0.48717949 14.447147 0.01694915 0.67177740 0.027537898
Numero di nodi:
[1] 1027
Densità:
[1] 0.9491095
indica una rete densa, altamente collegata.
Transitività:
[1] 0.3441892
rete poco clusterizzata.
Lunghezza media dei percorsi e diametro:
[1] 2.892956
[1] 5
molto breve, rete compatta e ben collegata.
Utilizzando la libreria poweRlaw, è possibile controllare se la mia distribuzione dei gradi segue una distribuzione power-law.
I pallini indicano la mia distribuzione dei gradi mentre la linea rossa indica la power-law adattata ai miei dati.
Il p-value di 0.33 indica che i miei dati sono compatibili con la distribuzione power-law, con pochi nodi altamente connessi (hub) e molti nodi con poche connessioni.
Collaborazione autori
La rete di collaborazione scientifica è una rete in cui i nodi sono gli autori e i legami sono le coautorialità in articoli, in quanto quest’ultima è una delle forme più documentate di collaborazione scientifica (Glanzel, 2004).
Due autori sono collegati nella rete se hanno collaborato insieme in un articolo.
Una rete di collaborazione tra autori può essere ottenuta utilizzando la formulazione generale: \[AC=A^T \cdot A\] dove A è una rete bipartita Papers x Autori.
L’elemento diagonale \(ac_i\) è il numero di papers di cui il ricercatore \(i\) è autore o coautore.
(Per comodità nella computazione e visualizzazione, vengono utilizzati soltanto i 30 nodi con il grado più alto).
Analisi della rete
Sono presenti 4 clusters ed in ognuno di essi è presente almeno un nodo con dei valori alti di centralità, il che indica un ruolo di connessione e influenza all’interno del cluster.
cluster 1: Prof. Chittaro e Prof. Serra
cluster 2: Prof. Policriti e Prof. Dovier
cluster 3: Prof. Montanari
cluster 4: Prof. Mizzaro e Prof. Della Mea
vertex cluster degree_centrality btw_centrality clos_centrality eigen_centrality pagerank_centrality
2 chittaro l 1 0.20689655 104.0937022 0.01724138 0.5445844 0.04010246
6 miculan m 1 0.13793103 27.7710751 0.01449275 0.3070842 0.02774521
8 foresti gl 1 0.27586207 40.7595238 0.01538462 0.5868884 0.05193366
9 piciarelli c 1 0.13793103 2.5277778 0.01234568 0.3254915 0.02740807
10 fontana f 1 0.06896552 2.0000000 0.01098901 0.1204134 0.01837675
17 scagnetto i 1 0.17241379 33.0877675 0.01470588 0.4221897 0.03271515
18 serra g 1 0.27586207 81.8256989 0.01587302 0.6961796 0.04862541
19 brajnik g 1 0.13793103 5.7349335 0.01408451 0.4288622 0.02630014
21 ranon r 1 0.06896552 5.6619048 0.01190476 0.1142127 0.01849130
27 micheloni c 1 0.13793103 1.4761905 0.01234568 0.3825232 0.02680649
29 tasso c 1 0.24137931 20.1095367 0.01515152 0.6186625 0.04362959
4 dovier a 2 0.17241379 12.9590804 0.01298701 0.5048830 0.03419016
5 policriti a 2 0.31034483 63.0502603 0.01408451 0.7569098 0.06050805
7 piazza c 2 0.17241379 6.4073260 0.01298701 0.5461876 0.03356030
11 formisano a 2 0.10344828 0.0000000 0.01030928 0.2782507 0.02261280
12 lancia g 2 0.03448276 0.0000000 0.01010101 0.1299985 0.01071465
13 pontelli e 2 0.13793103 0.3333333 0.01041667 0.3583081 0.02863919
1 montanari a 3 0.37931034 149.7373916 0.01785714 1.0000000 0.06829667
15 sala p 3 0.20689655 7.6666667 0.01369863 0.5887141 0.03925775
16 sciavicco g 3 0.17241379 65.6352227 0.01587302 0.5545742 0.03266792
20 peron a 3 0.17241379 3.9833333 0.01298701 0.5600494 0.03335311
22 gigante n 3 0.17241379 11.9320095 0.01449275 0.5759793 0.03294865
23 bresolin d 3 0.10344828 0.0000000 0.01315789 0.3681076 0.02139253
24 bozzelli l 3 0.10344828 0.0000000 0.01219512 0.3690480 0.02150901
25 geatti l 3 0.13793103 29.4044085 0.01470588 0.4534128 0.02748925
3 mizzaro s 4 0.27586207 26.0528726 0.01315789 0.6376023 0.04851419
14 roitero k 4 0.17241379 5.2903123 0.01190476 0.4221791 0.03181247
26 della mea v 4 0.17241379 6.2093599 0.01176471 0.3820190 0.03215018
28 demartini g 4 0.17241379 5.2903123 0.01190476 0.4221791 0.03181247
30 maddalena e 4 0.13793103 0.0000000 0.00990099 0.3201366 0.02643640
Numero di nodi:
[1] 1027
Densità:
[1] 0.02355658
indica una rete molto sparsa, poco collegata.
Transitività:
[1] 0.5462783
rete moderatamente clusterizzata.
Lunghezza media dei percorsi e diametro:
[1] 3.764174
[1] 7
breve, rete compatta e collegata.
Utilizzando la libreria poweRlaw, è possibile controllare se la mia distribuzione dei gradi segue una distribuzione power-law.
I pallini indicano la mia distribuzione dei gradi mentre la linea rossa indica la power-law adattata ai miei dati.
Il p-value di 0.17 indica che i miei dati sono compatibili con la distribuzione power-law, con pochi nodi altamente connessi (hub) e molti nodi con poche connessioni.
Power measure
Author PowerPercentage
6 MICULAN M 13.824084
5 POLICRITI A 9.242846
4 DOVIER A 6.816099
2 CHITTARO L 6.669387
1 MONTANARI A 6.471173
3 MIZZARO S 5.859651
19 BRAJNIK G 3.817711
60 PERESSOTTI M 3.615529
7 PIAZZA C 3.580627
12 LANCIA G 2.596333
22 FRANCESCHET M 2.564615
27 MIROLO C 2.314060
21 RANON R 2.263985
58 D'AGOSTINO G 1.965212
70 ROMANELLO R 1.789940
Analizzando la misura di potenza, la quale afferma che un nodo è potente se è connesso a nodi non potenti, si ricava che i nodi più potenti all’interno della rete delle collaborazioni sono il Prof. Miculan (13.8% del potere totale) e il Prof. Policriti (9.2% del potere totale).
Analisi parole chiave
Rete parole chiave
Rete Bipartita Papers x Keyword Scopus
Ogni paper ha associate delle parole chiave dal database di Scopus.
Word cloud
Dai dati della rete bipartita è possibile creare un dataframe con le frequenze delle parole, da cui si può ricavare una word cloud.
Le tre parole più presenti sono Computer Circuits (125), Semantics (101) e Temporal Logic (99).
Rete co-occorrenze parole chiave
(Per comodità nella computazione e visualizzazione, vengono utilizzati soltanto i 45 nodi con il grado più alto).
Ci sono 4 cluster di parole chiave:
nel primo, il nodo più centrale secondo le metriche di betweenness e closeness è “Mobile Devices”; mentre “Algorithms” risulta il nodo con centralità di autovettore e PageRank più alto;
nel secondo, “Computer Programming” è il nodo con betweenness e clonesess più alta, mentre “Computer Circuits” ha centralità di autovettore e PageRank più alto.
nel terzo,
nel quarto,
vertex cluster degree_centrality btw_centrality clos_centrality eigen_centrality
6 information retrieval 1 0.5454545 22.4801313 0.011904762 0.056459227
10 virtual reality 1 0.5227273 21.0523077 0.012195122 0.029511782
15 deep learning 1 0.3409091 11.7002640 0.010526316 0.019723813
19 mobile devices 1 0.5454545 79.5681415 0.014084507 0.031009269
24 user interfaces 1 0.4545455 29.0554626 0.012987013 0.032310035
27 human computer interaction 1 0.3181818 11.6507394 0.011904762 0.021454576
29 websites 1 0.3409091 14.7633647 0.011494253 0.009151213
34 search engines 1 0.3181818 16.6108246 0.011235955 0.019853430
37 quality control 1 0.4772727 51.1283408 0.013698630 0.024915514
1 computer circuits 2 0.5227273 2.5186584 0.010416667 1.000000000
2 semantics 2 0.7954545 2.2218083 0.010752688 0.565096241
3 temporal logic 2 0.5454545 7.8602517 0.011363636 0.877233399
4 logic programming 2 0.6136364 13.2212397 0.010869565 0.552949082
5 artificial intelligence 2 0.8863636 17.0831213 0.011764706 0.396922933
7 automata theory 2 0.6363636 5.9621451 0.010638298 0.399563225
9 computability and decidability 2 0.5000000 5.4817719 0.011111111 0.462710161
11 model checking 2 0.5909091 6.5987640 0.011764706 0.602612719
12 computer science 2 0.6590909 9.7839744 0.011363636 0.217081769
13 formal logic 2 0.5681818 0.4333333 0.009345794 0.404909334
14 computation theory 2 0.5681818 28.1866335 0.011904762 0.423228782
16 computer programming languages 2 0.6363636 16.1572287 0.012345679 0.339627848
17 problem solving 2 0.6136364 14.2647093 0.012048193 0.218931953
18 set theory 2 0.5454545 3.9449987 0.010752688 0.288069428
20 mathematical models 2 0.6136364 12.2622062 0.012345679 0.198403331
22 algebra 2 0.5227273 2.7353859 0.010309278 0.215624662
23 calculations 2 0.5000000 26.6158352 0.012195122 0.184360000
25 computational complexity 2 0.5681818 5.7745171 0.010638298 0.262873514
26 constraint theory 2 0.5681818 9.3433316 0.011764706 0.185752623
30 computer programming 2 0.5454545 35.0611154 0.012500000 0.161229398
32 database systems 2 0.5909091 62.4346465 0.012820513 0.096033108
38 computational linguistics 2 0.5681818 45.5723873 0.013333333 0.104261224
8 algorithms 3 0.8181818 22.0393695 0.012658228 0.209667485
21 computer simulation 3 0.7272727 50.9129478 0.013333333 0.116559391
31 learning systems 3 0.4545455 19.8959031 0.012195122 0.072854883
33 bioinformatics 3 0.5227273 51.0686281 0.012820513 0.089910678
39 data mining 3 0.5227273 28.1633496 0.012658228 0.062498328
43 information theory 3 0.5454545 39.8495789 0.013157895 0.070391481
28 human 4 0.4318182 3.7055486 0.011235955 0.030753496
35 humans 4 0.3863636 4.1569014 0.011235955 0.026110694
36 article 4 0.4090909 6.1375934 0.010989011 0.027216659
40 computer graphics 4 0.3636364 9.4157471 0.011111111 0.012027154
41 image analysis 4 0.3181818 15.1095939 0.011627907 0.015432547
42 female 4 0.2727273 5.6840909 0.010752688 0.007402049
44 diagnosis 4 0.3181818 13.8847762 0.011904762 0.013934399
45 priority journal 4 0.3409091 6.3179176 0.011627907 0.019834678
pagerank_centrality
6 0.022751385
10 0.017007700
15 0.011289926
19 0.019337653
24 0.016139454
27 0.016030811
29 0.012847247
34 0.013093741
37 0.010787434
1 0.054552145
2 0.045843705
3 0.043750705
4 0.037799786
5 0.035718099
7 0.029470671
9 0.027221367
11 0.030437252
12 0.022560411
13 0.029013690
14 0.025714782
16 0.024566142
17 0.026106806
18 0.022484240
20 0.023469211
22 0.020600603
23 0.016284159
25 0.022766949
26 0.021232125
30 0.018391213
32 0.014487293
38 0.012641814
8 0.034481620
21 0.021828512
31 0.014249688
33 0.012552149
39 0.013163492
43 0.012161876
28 0.030971072
35 0.026320896
36 0.023894536
40 0.014293203
41 0.008986545
42 0.015067567
44 0.012430595
45 0.015199730
Numero di nodi:
[1] 6360
Densità:
[1] 0.005569563
indica una rete molto sparsa, poco collegata.
Transitività:
[1] 0.2283555
rete poco clusterizzata.
Lunghezza media dei percorsi e diametro:
[1] 2.967987
[1] 5
molto breve, rete compatta e ben collegata.
Utilizzando la libreria poweRlaw, è possibile controllare se la mia distribuzione dei gradi segue una distribuzione power-law.
I pallini indicano la mia distribuzione dei gradi mentre la linea rossa indica la power-law adattata ai miei dati.
Il p-value di 0.43 indica che i miei dati sono compatibili con la distribuzione power-law, con pochi nodi altamente connessi (hub) e molti nodi con poche connessioni.
Mappa tematica
L’analisi di co-occorrenza delle parole chiave genera cluster tematici, la cui densità e centralità permettono di classificarli e mapparli in un diagramma bidimensionale, creando una mappa tematica.
Essa consente di analizzare i temi in base al quadrante in cui sono collocati:
quadrante in alto a sinistra: temi molto specializzati/di nicchia (cluster molto denso e poco centrale);
quadrante in alto a destra: temi motori (cluster molto denso e molto centrale);
quadrante in basso a sinistra: temi emergenti o in via di estinzione (cluster poco denso e poco centrale);
quadrante in basso a destra: temi di base (cluster poco denso ma molto centrale).
Ad esempio, il cluster in cui spicca la parola “algorithms” è nel quadrante dei temi di base, mentre “crowdsourcing” si trova nel quadrante dei temi emergenti o in declino. Il cluster con “finite element method” si trova nel quadrante dei temi di nicchia.
La colonna n.rel si riferisce alle frequenze relative delle parole all’interno del cluster di appartenenza.
# A tibble: 45 × 4
# Groups: Cluster [9]
Cluster Words Occurrences n.rel
<dbl> <chr> <dbl> <dbl>
1 1 algorithms 63 0.0696
2 1 deep learning 37 0.0409
3 1 computer simulation 37 0.0409
4 1 learning systems 31 0.0343
5 1 database systems 30 0.0331
6 2 semantics 101 0.0474
7 2 logic programming 92 0.0432
8 2 artificial intelligence 88 0.0413
9 2 automata theory 67 0.0315
10 2 computer science 55 0.0258
# ℹ 35 more rows
Conclusione FINIRE
L’analisi della produzione scientifica ha evidenziato diversi aspetti importanti, soprattutto attraverso l’analisi delle varie reti.
La rete dell’accoppiamento bibliografico tra autori ha mostrato come gli autori del dipartimento siano collegati tra loro attraverso le citazioni comuni, indicando una forte interconnessione tematica e la presenza di aree di ricerca ben definite e collaborazioni frequenti.
La rete di collaborazione tra autori ha rivelato la presenza di diversi cluster di collaborazione, con alcuni autori chiave che fungono da nodi centrali.
La rete delle co-occorrenze delle parole chiave ha messo in luce le principali aree di ricerca del dipartimento e le connessioni tematiche tra di esse. Alcune parole chiave emergono come particolarmente centrali e frequenti, riflettendo le aree di maggiore interesse e attività all’interno del dipartimento.
Inoltre, tutte le reti analizzate hanno la proprietà di piccolo mondo, con dei valori bassi di diametro e lunghezza media dei cammini e le tre distribuzioni di grado analizzate seguono una distribuzione dei gradi power-law.
In sintesi, si può dire che all’interno del dipartimento operano gruppi di ricerca che si distinguono per una notevole produttività scientifica, la quale si traduce in un significativo apporto alla letteratura di settore. Pur focalizzandosi su ambiti di ricerca differenti, i gruppi collaborano attivamente tra loro, favorendo lo scambio di conoscenze e competenze.
Tutte le nozioni viste a lezione sono utilizzate ma non ri-definite.↩︎